Belgedeki Tabloyu Okuma

Bu kod örneği, bir PDF belgesinden metin ve tablo verilerini çıkarmak için IronTesseract OCR motorunun nasıl kullanılacağını göstermektedir.

  1. IronTesseract OCR motorunun bir örneği oluşturulur.
  2. Bir OcrInput nesnesi başlatılır ve LoadPdf yöntemi kullanılarak bir PDF dosyası ("table.pdf") yüklenir.
  3. OCR motoru, belgeyi ReadDocumentAdvanced yöntemi kullanarak işler, bu da daha ayrıntılı bir OcrResult nesnesi döndürür.
  4. Belgedeki ilk tabloya result.Tables.First() kullanılarak erişilir ve bu tabloda yer alan hücre bilgisi CellInfos ile çıkarılır.
  5. Hücre verileri listesi (cellList) şimdi metin içeriği ve diğer detaylar (örneğin, hücre konumu, boyutu) dahil olmak üzere tablonun hücrelerini içermektedir.
  6. Bu yöntem, PDF'lerden tablolar gibi yapılandırılmış verileri çıkarmak için faydalıdır, her tablo hücresindeki metnin programatik olarak erişilmesine ve işlenmesine olanak tanır.

IronOCR ile PDF'lerdeki tabloları okumanın yollarını keşfedin.

Başlamaya Hazır mısınız?
Nuget İndirmeler 5,585,834 | Sürüm: 2026.4 just released
Still Scrolling Icon

Hala Kaydiriyor musunuz?

Hızlı bir kanit mi istiyorsunuz? PM > Install-Package IronOcr
örnekleri çalıştır resminizin aranabilir metne donuşünü izleyin.